var cheerio = require('cheerio');

exports.getContent = getNewsContent;

/**
 * 截取单个新闻的正文，
 * @param url 新闻的url地址
 * @param tag 新闻在web界面开始的标签 如:<div id='content'>新闻正文</div>。 content即为tag
 */

function getNewsContent(htmlData, tag) {
    var $ = cheerio.load(htmlData);
    var context = $(tag).text();
    var img = $(tag).find("img")[0];
    var imgPath;
    if (img !== null) {
        imgPath = $(img).attr("src"); //新闻的缩略图
    }
    return {
        context: context,
        imgPath: imgPath
    };
}

exports.getOneImage = function(htmlData, tag) {
    var $ = cheerio.load(htmlData);
    var context = $(tag).text();
    var img = $(tag).find("img")[0];
    var imgPath;
    if (img !== null) {
        imgPath = $(img).attr("src"); //新闻的缩略图
    }
    return imgPath;
}